Análisis propios de los ingresos de la Casen

por comunas y regiones

VE-CC-AJ

DataIntelligence
date: 17-08-2021

1 Introducción

1 Información de las Casen:
http://observatorio.ministeriodesarrollosocial.gob.cl/encuesta-casen-2011

2 En difícil encontar datos oficiales que entreguen información de los ingresos a nivel de persona por comunas en la Casen, porque es de hogares, lo que sociológicamente tiene sentido. La sociedad se comporta como órganos individuales funcionando dentro de los hogares. La enfermedad, como así mismo la caída del ingreso de un integrante de la familia los afecta a todos. Pensemos en la etnia, el sexo, edad, etc.

3 Fue un error haber eliminado outliers de las distribuciones de ingresos pues los resultados obtenidos de esta manera los hacen incomparables con cualquier otro tipo de análisis que no siga la misma metodologia. Casen no excluye outliers.

1.1 Cuatro fuentes de datos (las dos últimas las mismas, pero duplicadas)

Logramos obtener tres fuentes de datos:

Uno a nivel comunal en la Región Metropolitana y tres a nivel Regional:

  1. Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011) de la pagina 16 de aquí.

  2. Ingreso autónomo promedio e ingreso monetario promedio del hogar a nivel regional el 2015:

https://www.bcn.cl/portal/noticias?id=principales-resultados-sobre-pobreza-e-ingresos-regionales-encuesta-casen-2015

Por dos instrumentos diferentes oficiales llegamos a los mismos resultados y son a los cuales intentamos aproximarnos.

  1. Se comparará con la tabla obtenida en las III (ver aquí)

  1. Y la otra con una página interactiva con datos por región (ver aquí)


1.2 Los ingresos

Recordemos los cuatro datos cuantitativos fundamentales de la generación de los ingresos:

Tipo Ingreso total Ingreso autónomo Ingreso del trabajo Ingreso de la ocupación principal
año
2020 ytotcor yautcor ytrabajocor yoprcor
2017 ytotcor yautcor ytrabajocor yoprcor
2015 ytotcor yautcor ytrabajocor yoprcor
2013 ytotcor yautcor ytrabajocor yoprcor
2011 ytrabaj yautaj ytrabaj yopraj
2009 ytrabaj yautaj ytrabaj yopraj
2006 ytrabaj yautaj ytrabaj yopraj

1.3 Verificación de nuestros cálculos con datos oficiales (2020)

casen2020 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2020.rds")
casen2020 <- mutate_if(casen2020, is.factor, as.character)
casen2017 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2017_c.rds")
casen2017 <- mutate_if(casen2017, is.factor, as.character)
casen2015 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2015_c.rds")
casen2015 <- mutate_if(casen2015, is.factor, as.character)
casen2013 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2013_c.rds")
casen2013 <- mutate_if(casen2013, is.factor, as.character)
casen2011 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2011_c.rds")
casen2011 <- mutate_if(casen2011, is.factor, as.character)
casen2009 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2009_c.rds")
casen2009 <- mutate_if(casen2009, is.factor, as.character)
casen2006 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2006_c.rds")
casen2006 <- mutate_if(casen2006, is.factor, as.character)
 

# casen2006 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2006_c.rds")
# casen2006 <- mutate_if(casen2006, is.factor, as.character)
# casen2009 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2009_c.rds")
# casen2009 <- mutate_if(casen2009, is.factor, as.character)
# casen2011 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2011_c.rds")
# casen2011 <- mutate_if(casen2011, is.factor, as.character)
# casen2013 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2013_c.rds")
# casen2013 <- mutate_if(casen2013, is.factor, as.character)
# casen2015 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2015_c.rds")
# casen2015 <- mutate_if(casen2015, is.factor, as.character)
# casen2017 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2017_c.rds")
# casen2017 <- mutate_if(casen2017, is.factor, as.character)
# # casen2020 <- read.spss(file="C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2020.sav", to.data.frame=TRUE) 
# # saveRDS(casen2020,"casen2020.rds")
# casen2020 <- readRDS("casen2020.rds")
# casen2020 <- mutate_if(casen2020, is.factor, as.character)





reg_20 <- unique(casen2020$region)
# length(reg_20)
reg_17 <- unique(casen2017$region)
# length(reg_17)
reg_15 <- unique(casen2015$region)
# length(reg_15)
reg_13 <- unique(casen2013$region)
# length(reg_13)
reg_11 <- unique(casen2011$region)
# length(reg_11)
reg_09 <- unique(casen2009$REGION)
# length(reg_09)
reg_06 <- unique(casen2006$R)
# length(reg_06)

1.3.1 Ingreso del trabajo hogar: ytrabajocorh

tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  promedio = mean(rr$ytrabajocorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}

tabla_ing_aut <- read_xlsx("ingreso_del_trabajo_oficial_2020.xlsx")
names(tabla_ing_aut)[3] <- "region" 
names(tabla_ing_aut)[1] <- "region_c" 
 
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
kbl(tabla_unida) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region promedio Ingreso del trabajo
Región de Antofagasta 857293.2 888965.5
Región de Arica y Parinacota 582146.6 579584.7
Región de Atacama 677066.5 683321.3
Región de Aysén del Gral. Carlos Ibáñez del Campo 827858.4 813325.8
Región de Coquimbo 509835.9 545769.9
Región de La Araucanía 439756.2 477410.0
Región de Los Lagos 547181.9 610255.4
Región de Los Ríos 519901.5 541096.9
Región de Magallanes y de la Antártica Chilena 840063.2 855719.4
Región de Ñuble 414551.7 434823.4
Región de Tarapacá 759609.7 790225.5
Región de Valparaíso 585482.5 601530.0
Región del Biobío 541985.5 574339.2
Región del Libertador Gral. Bernardo O’Higgins 560888.8 581402.5
Región del Maule 536650.2 555357.6
Región Metropolitana de Santiago 1002331.7 960528.0
p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
  add_lines() 
p <- p %>% add_trace(y = ~`Ingreso del trabajo`, name = 'ingreso del trabajo oficial', mode = 'markers')
p 

1.3.2 Ingreso autonomo del hogar: yautcorh

tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  promedio = mean(rr$yautcorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}

tabla_ing_aut <- read_xlsx("ingreso_autonomo_2020_3.xlsx")
## New names:
## * `` -> ...3
names(tabla_ing_aut)[3] <- "region"
 
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
 
kbl(tabla_unida) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region promedio ingreso_autonomo
Región de Antofagasta 1033562.4 1070106
Región de Arica y Parinacota 729823.9 722752
Región de Atacama 835951.1 837976
Región de Aysén del Gral. Carlos Ibáñez del Campo 967604.2 948155
Región de Coquimbo 652691.3 693211
Región de La Araucanía 563733.0 609484
Región de Los Lagos 675912.4 735200
Región de Los Ríos 657513.9 679825
Región de Magallanes y de la Antártica Chilena 1067639.9 1082958
Región de Ñuble 536982.2 559368
Región de Tarapacá 905914.3 925396
Región de Valparaíso 771366.7 775964
Región del Biobío 691263.4 722494
Región del Libertador Gral. Bernardo O’Higgins 707819.6 723921
Región del Maule 656891.5 676096
Región Metropolitana de Santiago 1222056.5 1161517
p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
  add_lines() 
p <- p %>% add_trace(y = ~ingreso_autonomo, name = 'ingreso autonomo oficial', mode = 'markers')
p 

1.3.3 Ingreso del subsidio monetario: ysubh

tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  promedio = mean(rr$ysubh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}

tabla_ing_aut <- read_xlsx("subsidios_monetarios_oficial_2020.xlsx") 
names(tabla_ing_aut)[3] <- "region" 
names(tabla_ing_aut)[1] <- "region_c"
 
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
kbl(tabla_unida) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region promedio Subsidios monetarios
Región de Antofagasta 41288.96 40778.06
Región de Arica y Parinacota 58303.43 57346.83
Región de Atacama 53926.23 53825.15
Región de Aysén del Gral. Carlos Ibáñez del Campo 50612.77 50549.10
Región de Coquimbo 62351.79 58729.66
Región de La Araucanía 80434.04 77115.20
Región de Los Lagos 70241.05 64956.55
Región de Los Ríos 71363.66 71456.45
Región de Magallanes y de la Antártica Chilena 43825.70 43936.34
Región de Ñuble 74955.39 75234.80
Región de Tarapacá 46597.95 44113.69
Región de Valparaíso 56153.71 54399.97
Región del Biobío 63475.73 61586.01
Región del Libertador Gral. Bernardo O’Higgins 60012.31 59173.73
Región del Maule 69962.72 67472.14
Región Metropolitana de Santiago 42914.86 43006.41
p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
  add_lines() 
p <- p %>% add_trace(y = ~`Subsidios monetarios`, name = 'ingreso del subsidio monetarios oficial', mode = 'markers')
p 

1.3.4 Ingreso monetario: ymonecorh

tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  promedio = mean(rr$ymonecorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}

tabla_ing_aut <- read_xlsx("ingreso_monetario_oficial_2020.xlsx") 
names(tabla_ing_aut)[3] <- "region" 
names(tabla_ing_aut)[1] <- "region_c"
 
tabla_unida = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_unida <- tabla_unida[,-c(3)]
kbl(tabla_unida) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region promedio Ingreso monetario
Región de Antofagasta 1074851.4 1110884.1
Región de Arica y Parinacota 788127.3 780099.2
Región de Atacama 889877.3 891801.2
Región de Aysén del Gral. Carlos Ibáñez del Campo 1018217.0 998704.5
Región de Coquimbo 715043.1 751940.8
Región de La Araucanía 644167.1 686598.9
Región de Los Lagos 746153.4 800156.2
Región de Los Ríos 728877.5 751281.1
Región de Magallanes y de la Antártica Chilena 1111465.6 1126894.2
Región de Ñuble 611937.6 634603.0
Región de Tarapacá 952512.3 969509.3
Región de Valparaíso 827520.4 830363.7
Región del Biobío 754739.2 784080.2
Región del Libertador Gral. Bernardo O’Higgins 767831.9 783094.9
Región del Maule 726854.2 743567.7
Región Metropolitana de Santiago 1264971.3 1204523.7
p <- plot_ly(tabla_unida, width = 1200, x = ~
region, y = ~promedio) %>%
  add_lines() 
p <- p %>% add_trace(y = ~`Ingreso monetario`, name = 'ingreso monetario oficial', mode = 'markers')
p 

1.3.5 compararemos nuestros cálculos para otro año con los datos oficiales la variable: ytrabajocorh 2017

tabla_prom_reg <- data.frame()

for (i in reg_17) {
  casen_fh <- filter(casen2017, casen2017$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  promedio_2017 = mean(rr$ytrabajocorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}

tabla_ing_aut <- read_xlsx("ingreso_del_trabajo_oficial_2017.xlsx")
names(tabla_ing_aut)[3] <- "region" 
names(tabla_ing_aut)[1] <- "region_c" 
 
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
kbl(tabla_2017) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region promedio_2017 Ingreso del trabajo 2017
Región de Antofagasta 932541.0 974641.4
Región de Arica y Parinacota 600641.8 584868.1
Región de Atacama 685371.7 725666.9
Región de Ayséndel Gral. Carlos Ibáñez del Campo 896174.9 NA
Región de Coquimbo 496064.1 543329.2
Región de La Araucanía 494977.9 526971.2
Región de Los Lagos 603038.6 616955.3
Región de Los Ríos 558418.5 572722.4
Región de Magallanes y de la Antártica Chilena 991709.9 951359.1
Región de Ñuble 436229.9 450966.8
Región de Tarapacá 798910.2 773927.6
Región de Valparaíso 638730.9 650047.1
Región del Biobío 526766.1 567735.6
Región del Libertador Gral. Bernardo O’Higgins 525606.8 NA
Región del Maule 509444.0 531345.3
Región Metropolitana de Santiago 1110214.6 1029813.4
p <- plot_ly(tabla_2017, width = 1200, x = ~
region, y = ~promedio_2017) %>%
  add_lines() 
p <- p %>% add_trace(y = ~`Ingreso del trabajo 2017`, name = 'ingreso del trabajo 2017 oficial', mode = 'markers')
p 

1.3.6 Ingreso del trabajo hogar: yautcorh 2009-2020

Datos oficiales

datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("trabajo", ingreso) )
# datos_oficiales
kbl(datos_oficiales) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region ingreso publicado_2006 publicado_2009 publicado_2011 publicado_2013 publicado_2015 publicado_2017 publicado_2020
Región de Arica y Parinacota trabajo 273937.0 464614.3 445949.4 498799.3 601417.5 584868.1 579584.7
Región de Tarapacá trabajo 356800.1 419526.5 551249.9 761909.7 889361.3 773927.6 790225.5
Región de Antofagasta trabajo 538839.2 619294.1 781222.8 925370.3 890679.3 974641.4 888965.5
Región de Atacama trabajo 483336.2 479754.7 536536.5 680522.2 727487.4 725666.9 683321.3
Región de Coquimbo trabajo 317302.0 344288.7 398282.8 551228.4 563729.9 543329.2 545769.9
Región de Valparaíso trabajo 336348.8 398724.9 407404.0 529517.7 579701.3 650047.1 601530.0
Región Metropolitana de Santiago trabajo 561566.9 638431.3 664719.4 802969.4 913907.1 1029813.4 960528.0
Región del Libertador Gral. Bernardo O’Higgins trabajo 336467.3 388326.6 422118.6 490339.5 562065.3 547193.5 581402.5
Región del Maule trabajo 291301.4 334825.8 349494.8 420441.8 484619.3 531345.3 555357.6
Región de Ñuble trabajo NA NA NA NA NA 450966.8 434823.4
Región del Biobío trabajo 302906.9 341621.2 392531.3 427784.3 491868.1 567735.6 574339.2
Región de La Araucanía trabajo 278035.9 287299.3 347746.9 420189.4 460048.5 526971.2 477410.0
Región de Los Ríos trabajo 290154.3 280783.0 381946.1 410961.0 555862.9 572722.4 541096.9
Región de Los Lagos trabajo 365727.0 349611.2 386519.0 477580.5 514329.1 616955.3 610255.4
Región de Aysén del Gral. Carlos Ibáñez del Campo trabajo 373691.7 508744.3 584967.7 644193.8 744554.2 921386.4 813325.8
Región de Magallanes y de la Antártica Chilena trabajo 470099.6 491311.8 597909.3 695091.8 795825.1 951359.1 855719.4
#### 2020

tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2020 = mean(rr$ytrabajocorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
 tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
 
tabla_prom_reg <- data.frame()

for (i in reg_17) {
  casen_fh <- filter(casen2017, casen2017$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ytrabajocorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2017 = mean(rr$ytrabajocorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
  
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
  
#### 2015
 
tabla_prom_reg <- data.frame()
 
for (i in reg_15) {
  casen_fh <- filter(casen2015, casen2015$region == i)
  
casen_fh <- casen_fh[,c("region","folio.x","ytrabajoCorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2015 = mean(rr$ytrabajoCorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
  
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
 
#### 2013

tabla_prom_reg <- data.frame()
 
for (i in reg_13) {
  casen_fh <- filter(casen2013, casen2013$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ytrabajoCorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2013 = mean(rr$ytrabajoCorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
  
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]

tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)

#### 2011
 
tabla_prom_reg <- data.frame()

for (i in reg_11) {
  casen_fh <- filter(casen2011, casen2011$region == i)
 
casen_fh <- casen_fh[,c("region","folio","ytrabhaj")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2011 = mean(rr$ytrabhaj)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
  
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
 
#### 2009

tabla_prom_reg <- data.frame()

for (i in reg_09) {
  casen_fh <- filter(casen2009, casen2009$REGION == i)

casen_fh <- casen_fh[,c("REGION","FOLIO","YTRABHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
  
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2009 = mean(rr$YTRABHAJ)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
  
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)

tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

Datos calculados

ingresos  = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos  = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)

 
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)] 

tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020

tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
          options = list(
            dom = 'Blfrtip',
            buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
            pageLength = 5,
            autoWidth = TRUE,
            
            scrollX = TRUE,
            lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 

2 Comparación de los ingresos por tipo y región entre los años 2017-2020

p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines() 
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers') 
p

2.0.1 Ingreso del trabajo hogar: yautcorh 2009-2020

Datos oficiales

datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("autonomo", ingreso) )
# datos_oficiales
kbl(datos_oficiales) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region ingreso publicado_2006 publicado_2009 publicado_2011 publicado_2013 publicado_2015 publicado_2017 publicado_2020
Región de Arica y Parinacota autonomo 455711.3 547756.1 521609.8 590279.8 701921.2 700290.0 722752.3
Región de Tarapacá autonomo 430552.5 482263.9 636144.0 852310.9 1013692.4 895906.9 925395.6
Región de Antofagasta autonomo 620142.3 712791.6 870751.4 1040617.4 1030784.5 1100413.5 1070106.0
Región de Atacama autonomo 538992.0 534476.2 615019.0 764759.0 845319.5 831639.1 837976.1
Región de Coquimbo autonomo 373831.3 405748.7 467749.4 626140.8 676049.3 641496.8 693211.1
Región de Valparaíso autonomo 409373.4 488210.3 511278.9 653095.2 730133.1 822175.1 775963.8
Región Metropolitana de Santiago autonomo 635770.0 747262.0 772944.6 926896.7 1063093.3 1196585.6 1161517.2
Región del Libertador Gral. Bernardo O’Higgins autonomo 396019.6 455185.5 507079.3 584098.8 671377.6 665508.4 723921.2
Región del Maule autonomo 337214.6 385924.8 406924.7 503550.8 573882.2 624447.0 676095.6
Región de Ñuble autonomo NA NA NA NA NA 560323.3 559368.3
Región del Biobío autonomo 364911.6 413185.7 474031.7 516538.4 600407.6 696965.0 722494.2
Región de La Araucanía autonomo 325675.3 329384.3 410726.1 489329.4 551447.1 613599.3 609483.7
Región de Los Ríos autonomo 339440.1 340854.6 451740.6 501305.7 667652.5 677529.8 679824.6
Región de Los Lagos autonomo 408472.2 409901.7 444647.8 556749.8 593413.0 709480.2 735199.7
Región de Aysén del Gral. Carlos Ibáñez del Campo autonomo 422506.1 551261.6 663705.1 734226.8 835305.2 1035091.2 948155.4
Región de Magallanes y de la Antártica Chilena autonomo 552773.8 575062.7 709173.7 808754.7 945704.1 1087572.4 1082957.9
#### 2020

tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2020 = mean(rr$yautcorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
 tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
 
tabla_prom_reg <- data.frame()

for (i in reg_17) {
  casen_fh <- filter(casen2017, casen2017$region == i)
  
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2017 = mean(rr$yautcorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
  
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
  
#### 2015

tabla_prom_reg <- data.frame()
 
for (i in reg_15) {
  casen_fh <- filter(casen2015, casen2015$region == i)
  
casen_fh <- casen_fh[,c("region","folio.x","yautcorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2015 = mean(rr$yautcorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
  
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
 
#### 2013

tabla_prom_reg <- data.frame()
 
for (i in reg_13) {
  casen_fh <- filter(casen2013, casen2013$region == i)
  
casen_fh <- casen_fh[,c("region","folio","yautcorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2013 = mean(rr$yautcorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
  
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]

tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)

#### 2011
 
tabla_prom_reg <- data.frame()

for (i in reg_11) {
  casen_fh <- filter(casen2011, casen2011$region == i)
  
casen_fh <- casen_fh[,c("region","folio","yauthaj")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2011 = mean(rr$yauthaj)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
  
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
 
#### 2009

tabla_prom_reg <- data.frame()

for (i in reg_09) {
  casen_fh <- filter(casen2009, casen2009$REGION == i)
  
casen_fh <- casen_fh[,c("REGION","FOLIO","YAUTHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
  
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2009 = mean(rr$YAUTHAJ)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
  
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)

tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

Datos calculados

ingresos  = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos  = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)

 
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)] 

tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020

tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
          options = list(
            dom = 'Blfrtip',
            buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
            pageLength = 5,
            autoWidth = TRUE,
            
            scrollX = TRUE,
            lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 

3 Comparación de los ingresos por tipo y región entre los años 2017-2020

p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines() 
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers') 
p

3.0.1 Ingreso del trabajo hogar: yautcorh 2009-2020

Datos oficiales

datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("ing_mone", ingreso) )
# datos_oficiales
kbl(datos_oficiales) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region ingreso publicado_2006 publicado_2009 publicado_2011 publicado_2013 publicado_2015 publicado_2017 publicado_2020
Región de Arica y Parinacota ing_mone 463659.7 563721.8 538965.5 609744.8 728759.6 730932.0 780099.2
Región de Tarapacá ing_mone 434577.6 499936.4 650988.8 870398.7 1030966.6 920711.8 969509.3
Región de Antofagasta ing_mone 625649.9 728695.5 884358.8 1053339.3 1043365.4 1120898.8 1110884.1
Región de Atacama ing_mone 546803.7 551254.0 631666.5 786621.7 875657.2 858854.0 891801.2
Región de Coquimbo ing_mone 383547.5 424795.0 487346.9 652488.0 704604.0 676770.4 751940.8
Región de Valparaíso ing_mone 415826.3 506343.5 526382.5 673501.8 755572.0 852810.5 830363.7
Región Metropolitana de Santiago ing_mone 640170.5 759986.2 785186.5 943152.8 1084765.8 1220391.2 1204523.7
Región del Libertador Gral. Bernardo O’Higgins ing_mone 404132.3 474787.3 522510.6 607165.2 698548.0 697585.6 783094.9
Región del Maule ing_mone 346797.6 409871.8 431202.6 532486.2 607551.1 666538.3 743567.7
Región de Ñuble ing_mone NA NA NA NA NA 607345.3 634603.0
Región del Biobío ing_mone 375227.0 438106.5 496232.3 546662.5 633081.2 731405.1 784080.2
Región de La Araucanía ing_mone 338972.5 361682.5 441061.6 526240.0 594777.8 661323.7 686598.9
Región de Los Ríos ing_mone 349926.7 368752.0 475686.2 532100.2 704470.9 718690.9 751281.1
Región de Los Lagos ing_mone 421194.7 441146.3 472960.4 590739.6 629811.7 752912.3 800156.2
Región de Aysén del Gral. Carlos Ibáñez del Campo ing_mone 432317.0 571944.7 685532.0 766424.6 875098.8 1076049.0 998704.5
Región de Magallanes y de la Antártica Chilena ing_mone 557279.3 587570.7 724301.4 822881.3 963292.3 1113507.7 1126894.2
#### 2020
 
tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2020 = mean(rr$ymonecorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
 tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
 
tabla_prom_reg <- data.frame()

for (i in reg_17) {
  casen_fh <- filter(casen2017, casen2017$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2017 = mean(rr$ymonecorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
  
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
  
#### 2015

tabla_prom_reg <- data.frame()
 
for (i in reg_15) {
  casen_fh <- filter(casen2015, casen2015$region == i)
  
casen_fh <- casen_fh[,c("region","folio.x","ymoneCorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2015 = mean(rr$ymoneCorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
  
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
 
#### 2013

tabla_prom_reg <- data.frame()
 
for (i in reg_13) {
  casen_fh <- filter(casen2013, casen2013$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymoneCorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2013 = mean(rr$ymoneCorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
  
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]

tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)

#### 2011
 
tabla_prom_reg <- data.frame()
 
for (i in reg_11) {
  casen_fh <- filter(casen2011, casen2011$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymonehaj")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2011 = mean(rr$ymonehaj)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
  
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
 
#### 2009

tabla_prom_reg <- data.frame()

for (i in reg_09) {
  casen_fh <- filter(casen2009, casen2009$REGION == i)
  
casen_fh <- casen_fh[,c("REGION","FOLIO","YMONEHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
  
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2009 = mean(rr$YMONEHAJ)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
  
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)

tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

Datos calculados

ingresos  = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos  = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)
 
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)] 

tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020

tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
          options = list(
            dom = 'Blfrtip',
            buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
            pageLength = 5,
            autoWidth = TRUE,
            
            scrollX = TRUE,
            lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 

4 Comparación de los ingresos por tipo y región entre los años 2017-2020

p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines() 
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers') 
p

4.0.1 Ingreso del trabajo hogar: yautcorh 2009-2020

Datos oficiales

datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("sub_mone", ingreso) )
# datos_oficiales
kbl(datos_oficiales) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region ingreso publicado_2006 publicado_2009 publicado_2011 publicado_2013 publicado_2015 publicado_2017 publicado_2020
Región de Arica y Parinacota sub_mone 7948.429 15965.73 17355.73 19465.01 26838.40 30641.95 57346.83
Región de Tarapacá sub_mone 4025.152 17672.53 14844.73 18087.74 17274.22 24804.87 44113.69
Región de Antofagasta sub_mone 5507.611 15903.83 13607.43 12721.94 12580.87 20485.34 40778.06
Región de Atacama sub_mone 7811.712 16777.82 16647.45 21862.71 30337.69 27214.92 53825.15
Región de Coquimbo sub_mone 9716.166 19046.34 19597.48 26347.20 28554.62 35273.59 58729.66
Región de Valparaíso sub_mone 6452.860 18133.21 15103.67 20406.61 25438.93 30635.36 54399.97
Región Metropolitana de Santiago sub_mone 4400.518 12724.21 12241.89 16256.10 21672.54 23805.58 43006.41
Región del Libertador Gral. Bernardo O’Higgins sub_mone 8112.720 19601.76 15431.29 23066.40 27170.36 32077.17 59173.73
Región del Maule sub_mone 9583.027 23947.01 24277.94 28935.45 33668.93 42091.30 67472.14
Región de Ñuble sub_mone NA NA NA NA NA 47022.00 75234.80
Región del Biobío sub_mone 10315.369 24920.89 22200.52 30124.13 32673.67 34440.05 61586.01
Región de La Araucanía sub_mone 13297.141 32298.19 30335.47 36910.61 43330.71 47724.39 77115.20
Región de Los Ríos sub_mone 10486.642 27897.33 23945.65 30794.45 36818.34 41161.07 71456.45
Región de Los Lagos sub_mone 12722.442 31244.62 28312.58 33989.83 36398.68 43432.04 64956.55
Región de Aysén del Gral. Carlos Ibáñez del Campo sub_mone 9810.922 20683.10 21826.90 32197.79 39793.58 40957.76 50549.10
Región de Magallanes y de la Antártica Chilena sub_mone 4505.516 12508.03 15127.66 14126.59 17588.17 25935.29 43936.34
#### 2020
 
tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2020 = mean(rr$ysubh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
 tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
 
tabla_prom_reg <- data.frame()

for (i in reg_17) {
  casen_fh <- filter(casen2017, casen2017$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2017 = mean(rr$ysubh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
  
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
  
#### 2015

tabla_prom_reg <- data.frame()

for (i in reg_15) {
  casen_fh <- filter(casen2015, casen2015$region == i)
  
casen_fh <- casen_fh[,c("region","folio.x","ysubh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2015 = mean(rr$ysubh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
  
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
 
#### 2013

tabla_prom_reg <- data.frame()

for (i in reg_13) {
  casen_fh <- filter(casen2013, casen2013$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ysubh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2013 = mean(rr$ysubh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
  
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]

tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)

#### 2011
 
tabla_prom_reg <- data.frame()

for (i in reg_11) {
  casen_fh <- filter(casen2011, casen2011$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ysubhaj")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2011 = mean(rr$ysubhaj)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
  
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
 
#### 2009

tabla_prom_reg <- data.frame()

for (i in reg_09) {
  casen_fh <- filter(casen2009, casen2009$REGION == i)
  
casen_fh <- casen_fh[,c("REGION","FOLIO","YSUBHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
  
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2009 = mean(rr$YSUBHAJ)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
  
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)

tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

Datos calculados

ingresos  = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos  = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)

datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)] 


tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020

tabla_f %>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
            options = list(
            dom = 'Blfrtip',
            buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
            pageLength = 5,
            autoWidth = TRUE,
            
            scrollX = TRUE,
            lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 

5 Comparación de los ingresos por tipo y región entre los años 2017-2020

p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines() 
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers') 
p

5.0.1 Ingreso del trabajo hogar: yautcorh 2009-2020

Datos oficiales

datos_oficiales <- read_xlsx("ingresos_oficiales_2006-2020.xlsx")
datos_oficiales <- cbind(datos_oficiales[,c(9,10)],mutate_if(datos_oficiales[,2:8], is.character, as.numeric))
datos_oficiales <- filter(datos_oficiales, grepl("ing_mone", ingreso) )
# datos_oficiales
kbl(datos_oficiales) %>%
  kable_styling(bootstrap_options = c("striped", "hover")) %>%
  kable_paper() %>%
  scroll_box(width = "100%", height = "300px")
region ingreso publicado_2006 publicado_2009 publicado_2011 publicado_2013 publicado_2015 publicado_2017 publicado_2020
Región de Arica y Parinacota ing_mone 463659.7 563721.8 538965.5 609744.8 728759.6 730932.0 780099.2
Región de Tarapacá ing_mone 434577.6 499936.4 650988.8 870398.7 1030966.6 920711.8 969509.3
Región de Antofagasta ing_mone 625649.9 728695.5 884358.8 1053339.3 1043365.4 1120898.8 1110884.1
Región de Atacama ing_mone 546803.7 551254.0 631666.5 786621.7 875657.2 858854.0 891801.2
Región de Coquimbo ing_mone 383547.5 424795.0 487346.9 652488.0 704604.0 676770.4 751940.8
Región de Valparaíso ing_mone 415826.3 506343.5 526382.5 673501.8 755572.0 852810.5 830363.7
Región Metropolitana de Santiago ing_mone 640170.5 759986.2 785186.5 943152.8 1084765.8 1220391.2 1204523.7
Región del Libertador Gral. Bernardo O’Higgins ing_mone 404132.3 474787.3 522510.6 607165.2 698548.0 697585.6 783094.9
Región del Maule ing_mone 346797.6 409871.8 431202.6 532486.2 607551.1 666538.3 743567.7
Región de Ñuble ing_mone NA NA NA NA NA 607345.3 634603.0
Región del Biobío ing_mone 375227.0 438106.5 496232.3 546662.5 633081.2 731405.1 784080.2
Región de La Araucanía ing_mone 338972.5 361682.5 441061.6 526240.0 594777.8 661323.7 686598.9
Región de Los Ríos ing_mone 349926.7 368752.0 475686.2 532100.2 704470.9 718690.9 751281.1
Región de Los Lagos ing_mone 421194.7 441146.3 472960.4 590739.6 629811.7 752912.3 800156.2
Región de Aysén del Gral. Carlos Ibáñez del Campo ing_mone 432317.0 571944.7 685532.0 766424.6 875098.8 1076049.0 998704.5
Región de Magallanes y de la Antártica Chilena ing_mone 557279.3 587570.7 724301.4 822881.3 963292.3 1113507.7 1126894.2
#### 2020
 
tabla_prom_reg <- data.frame()

for (i in reg_20) {
  casen_fh <- filter(casen2020, casen2020$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2020 = mean(rr$ymonecorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
 tabla_ing_aut <- datos_oficiales[,c("region","publicado_2020")]
tabla_2020 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2020 <- tabla_2020[,-c(3)]
 
tabla_prom_reg <- data.frame()

for (i in reg_17) {
  casen_fh <- filter(casen2017, casen2017$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymonecorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2017 = mean(rr$ymonecorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2017")]
  
tabla_2017 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2017 <- tabla_2017[,-c(3)]
  
#### 2015

tabla_prom_reg <- data.frame()
 
for (i in reg_15) {
  casen_fh <- filter(casen2015, casen2015$region == i)
  
casen_fh <- casen_fh[,c("region","folio.x","ymoneCorh")]
casen_fh$folio.x <- as.character(casen_fh$folio.x)
  
tabla <- table(casen_fh$folio.x)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio.x","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio.x", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio.x ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2015 = mean(rr$ymoneCorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2015")]
  
tabla_2015 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2015 <- tabla_2015[,-c(3)]
tabla_2015$calculado_2015 <- as.numeric(tabla_2015$calculado_2015)
tabla_2015$region[tabla_2015$region == "Región del Libertador Gral. Bernardo O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
 
#### 2013

tabla_prom_reg <- data.frame()
 
for (i in reg_13) {
  casen_fh <- filter(casen2013, casen2013$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymoneCorh")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2013 = mean(rr$ymoneCorh)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2013")]
  
tabla_2013 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2013 <- tabla_2013[,-c(3)]

tabla_2013$region[tabla_2013$region == "I. Tarapaca"] <- "Región de Tarapacá"
tabla_2013$region[tabla_2013$region == "II. Antofagasta"] <- "Región de Antofagasta"
tabla_2013$region[tabla_2013$region == "III. Atacama"] <- "Región de Atacama"
tabla_2013$region[tabla_2013$region == "IV. Coquimbo"] <- "Región de Coquimbo"
tabla_2013$region[tabla_2013$region == "IX. La Araucanía"] <- "Región de La Araucanía"
tabla_2013$region[tabla_2013$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2013$region[tabla_2013$region == "V. Valparaíso"] <- "Región de Valparaíso"
tabla_2013$region[tabla_2013$region == "VI. O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2013$region[tabla_2013$region == "VII. Maule"] <- "Región del Maule"
tabla_2013$region[tabla_2013$region == "VIII. Biobío"] <- "Región del Biobío"
tabla_2013$region[tabla_2013$region == "X. Los Lagos"] <- "Región de Los Lagos"
tabla_2013$region[tabla_2013$region == "XI. Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2013$region[tabla_2013$region == "XII. Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2013$region[tabla_2013$region == "XIV. Los Ríos"] <- "Región de Los Ríos"
tabla_2013$region[tabla_2013$region == "XV. Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2013$calculado_2013 <- as.numeric(tabla_2013$calculado_2013)

#### 2011
 
tabla_prom_reg <- data.frame()
 
for (i in reg_11) {
  casen_fh <- filter(casen2011, casen2011$region == i)
  
casen_fh <- casen_fh[,c("region","folio","ymonehaj")]
casen_fh$folio <- as.character(casen_fh$folio)
  
tabla <- table(casen_fh$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$folio ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2011 = mean(rr$ymonehaj)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2011")]
  
tabla_2011 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2011 <- tabla_2011[,-c(3)]
tabla_2011$region[tabla_2011$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2011$region[tabla_2011$region == "Araucanía"] <- "Región de La Araucanía"
tabla_2011$region[tabla_2011$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2011$region[tabla_2011$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2011$region[tabla_2011$region == "Bio Bio"] <- "Región del Biobío"
tabla_2011$region[tabla_2011$region == "Copiapó"] <- "Región de Atacama"
tabla_2011$region[tabla_2011$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2011$region[tabla_2011$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2011$region[tabla_2011$region == "Los Ríos"] <- "Región de Los Ríos"
tabla_2011$region[tabla_2011$region == "Magallanes"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2011$region[tabla_2011$region == "Maule"] <- "Región del Maule"
tabla_2011$region[tabla_2011$region == "Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2011$region[tabla_2011$region == "O Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2011$region[tabla_2011$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2011$region[tabla_2011$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2011$calculado_2011 <- as.numeric(tabla_2011$calculado_2011)
 
#### 2009

tabla_prom_reg <- data.frame()

for (i in reg_09) {
  casen_fh <- filter(casen2009, casen2009$REGION == i)
  
casen_fh <- casen_fh[,c("REGION","FOLIO","YMONEHAJ")]
casen_fh$FOLIO <- as.character(casen_fh$FOLIO)
  
tabla <- table(casen_fh$FOLIO)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("FOLIO","freq_folio")
repetidos2 <- merge(x=casen_fh, y=tabla, by = "FOLIO", all.x = T)
repetidos2 <- repetidos2[,c(2,1,4,3)]
rr <- repetidos2[!duplicated(repetidos2$FOLIO ), ]

tabla_reg <- data.frame(
  region = i,
  calculado_2009 = mean(rr$YMONEHAJ)
)

tabla_prom_reg <- rbind(tabla_prom_reg, tabla_reg)

}
tabla_prom_reg <- rbind(tabla_prom_reg,c("Región de Ñuble",NA))
 
  tabla_ing_aut <- datos_oficiales[,c("region","publicado_2009")]
  
tabla_2009 = merge(x = tabla_prom_reg, y = tabla_ing_aut, by = "region", all.x = T)
tabla_2009 <- tabla_2009[,-c(3)]
tabla_2009$region[tabla_2009$region == "Antofagasta"] <- "Región de Antofagasta"
tabla_2009$region[tabla_2009$region == "Arica y Parinacota"] <- "Región de Arica y Parinacota"
tabla_2009$region[tabla_2009$region == "Atacama"] <- "Región de Atacama"
tabla_2009$region[tabla_2009$region == "Aysén"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2009$region[tabla_2009$region == "Bío Bío"] <- "Región del Biobío"
tabla_2009$region[tabla_2009$region == "Coquimbo"] <- "Región de Coquimbo"
tabla_2009$region[tabla_2009$region == "La Araucanía"] <- "Región de La Araucanía"
tabla_2009$region[tabla_2009$region == "Libertador Bernardo O´Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2009$region[tabla_2009$region == "Los Lagos"] <- "Región de Los Lagos"
tabla_2009$region[tabla_2009$region == "Los Rios"] <- "Región de Los Ríos"
tabla_2009$region[tabla_2009$region == "Magallanes Y La Antártica Chilena"] <- "Región de Magallanes y de la Antártica Chilena"
tabla_2009$region[tabla_2009$region == "Maule"] <- "Región del Maule"
tabla_2009$region[tabla_2009$region == "Región Metropolitana"] <- "Región Metropolitana de Santiago"
tabla_2009$region[tabla_2009$region == "Tarapacá"] <- "Región de Tarapacá"
tabla_2009$region[tabla_2009$region == "Valparaíso"] <- "Región de Valparaíso"
tabla_2009$calculado_2009 <- as.numeric(tabla_2009$calculado_2009)

tabla_2017$region[tabla_2017$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2017$region[tabla_2017$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"
tabla_2020$region[tabla_2020$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
tabla_2020$region[tabla_2020$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

Datos calculados

ingresos  = merge(x = tabla_2017, y = tabla_2020, by = "region", all.x = T)
ingresos  = merge(x = tabla_2015, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2013, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2011, y = ingresos, by = "region", all.x = T)
ingresos  = merge(x = tabla_2009, y = ingresos, by = "region", all.x = T)
 
datos_oficiales$region[datos_oficiales$region == "Región de Ayséndel Gral. Carlos Ibáñez del Campo"] <- "Región de Aysén del Gral. Carlos Ibáñez del Campo"
datos_oficiales$region[datos_oficiales$region == "Región del Libertador Gral. Bernardo O’Higgins"] <- "Región del Libertador Gral. Bernardo O'Higgins"

tabla_f = merge( x = ingresos, y = datos_oficiales, by = "region" , all.x = T)
tabla_f <- tabla_f[,c(8,1:7,9:15)] 

tabla_f$por_09_11 <- 100*tabla_f$calculado_2009/tabla_f$calculado_2011
tabla_f$por_11_13 <- 100*tabla_f$calculado_2011/tabla_f$calculado_2013
tabla_f$por_13_15 <- 100*tabla_f$calculado_2013/tabla_f$calculado_2015
tabla_f$por_15_17 <- 100*tabla_f$calculado_2015/tabla_f$calculado_2017
tabla_f$por_17_20 <- 100*tabla_f$calculado_2017/tabla_f$calculado_2020

tabla_f%>% datatable(extensions = 'Buttons',class = 'cell-border stripe',
          options = list(
            dom = 'Blfrtip',
            buttons = c('copy', 'csv', 'excel', 'pdf', 'print'),
            pageLength = 5,
            autoWidth = TRUE,
            
            scrollX = TRUE,
            lengthMenu = list(c(10,25,50,-1),c(10,25,50,"All"))
)) 

6 Comparación de los ingresos por tipo y región entre los años 2017-2020

p <- plot_ly(tabla_f, width = 1200, x = ~region, y = ~calculado_2009, name = 'calculado 2009', mode = 'markers') %>% add_lines() 
p <- p %>% add_lines(y = ~calculado_2011, name = 'calculado 2011', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2013, name = 'calculado 2013', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2015, name = 'calculado 2015', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2017, name = 'calculado 2017', mode = 'markers')
p <- p %>% add_lines(y = ~calculado_2020, name = 'calculado 2020', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2009`, name = 'Oficial 2009', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2011`, name = 'Oficial 2011', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2013`, name = 'Oficial 2013', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2015`, name = 'Oficial 2015', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2017`, name = 'Oficial 2017', mode = 'markers') 
p <- p %>% add_trace(y = ~`publicado_2020`, name = 'Oficial 2020', mode = 'markers') 
p

7 Validación de los diferentes tipos de ingreso de la Casen comparando calculos propios con los oficiales ($ noviembre de cada año)

link 1(ver aquí)

link 2 (ver aquí)

POBREZA EN PORCENTAJE DE PERSONAS 2006

unique(casen2006$CORTE)
## [1] "No pobre"           "Indigente"          "Pobre no indigente"
## [4] NA
tabla_matp <-xtabs(casen2006$EXPC~COMUNA+CORTE, data = casen2006)
head(tabla_matp,10)
##                  CORTE
## COMUNA            Indigente No pobre Pobre no indigente
##   Aisén                 776    22452                402
##   Algarrobo             307     9647                831
##   Alhué                 166     4013                441
##   Alto Bío Bío         1317     5825               1936
##   Alto del Carmen         0     4450                 61
##   Alto Hospicio        3523    58114              12901
##   Ancud                 309    37931               2579
##   Andacollo             421     6746               2041
##   Angol                3302    37857               7814
##   Antofagasta          8968   305199              10778
s1 <- sum(tabla_matp[,1])+sum(tabla_matp[,2])+sum(tabla_matp[,3])
s2 <- sum(tabla_matp[,1])

s2*100/s1
## [1] 3.206491
casen_2006_r1 <- filter(casen2006, casen2006$R == "VIII")
# head(casen_2006_r1)
# casen_2006_r1 %>% filter(!is.na(CORTE))

tabla_matp <-xtabs(casen_2006_r1$EXPR~R+CORTE, data = casen_2006_r1)
# head(tabla_matp,10)
s1 <- sum(tabla_matp[,1])+sum(tabla_matp[,2])+sum(tabla_matp[,3])
s2 <- sum(tabla_matp[,3])
 
s2*100/s1
## [1] 15.51188

8 El ingreso autónomo per cápita del hogar

8.1 Ingreso autónomo percápita del hogar, CASEN 2011 ($ de noviembre de 2011)

Ingreso autónomo per cápita del hogar, promedio de los hogares es el Valor correspondiente a la suma de los ingresos autónomos per cápita de todos los hogares, dividido por el total de hogares.

El ingreso autónomo se define como todos los pagos que recibe el hogar, provenientes tanto del trabajo como de la propiedad de los activos. Estos incluyen sueldos y salarios (monetarios y en especies), ganancias provenientes del trabajo independiente, la auto provisión de bienes producidos por el hogar, rentas, intereses, jubilaciones, pensiones, montepíos y transferencias corrientes entre privados.

El ingreso autónomo per cápita del hogar es la suma de los ingresos autónomos de todos los miembros del hogar, dividido por el número de integrantes del hogar, excluido el servicio doméstico puertas adentro.

folio: Identificación del hogar.

# casen2011 <- readRDS("C:/Users/chris/OneDrive/Documentos/archivos_grandes/casen_2011_c.rds")
casen2011 <- readRDS("C:/Users/enamo/Desktop/Shiny-R/Casen_en_pandemia_2020/casen/casen_2011_c.rds")
casen2011  <- mutate_if(casen2011, is.factor, as.character)
# head(casen2011,5)

8.1.1 Hacemos un subset con la region metropolitana

casen2011_rm <- filter(casen2011, casen2011$region == "Metropolitana")
# comuna_ing <- unique(casen2011_rm$comuna)
tabla <- table(casen2011_rm$folio)
tabla <- as.data.frame(tabla)
colnames(tabla) <- c("folio","freq_folio")
head(tabla,10)
##           folio freq_folio
## 1  131011001011          1
## 2  131011001041          1
## 3  131011001061          1
## 4  131011001121          1
## 5  131011001131          1
## 6  131011001161          1
## 7  131011001191          3
## 8  131011001201          1
## 9  131011001211          1
## 10 131011001221          2
casen_fh <- casen2011_rm[,c("comuna","folio","yauthaj","expc_full","numper")]
casen_fh$folio <- as.character(casen_fh$folio)
repetidos2 <- merge(x=casen_fh, y=tabla, by = "folio", all.x = T)
#repetidos2 <- repetidos2[,c(2,1,6,4,5)]
rr <- repetidos2[!duplicated(repetidos2$folio), ]
head(rr,10)
##           folio   comuna yauthaj expc_full numper freq_folio
## 1  131011001011 Santiago 1653583        94      1          1
## 2  131011001041 Santiago  560401        94      1          1
## 3  131011001061 Santiago 1044093        94      1          1
## 4  131011001121 Santiago 1430074        94      1          1
## 5  131011001131 Santiago  444180        94      1          1
## 6  131011001161 Santiago  613347        94      1          1
## 7  131011001191 Santiago 1235752        94      3          3
## 10 131011001201 Santiago 1674543        94      1          1
## 11 131011001211 Santiago  295815        94      1          1
## 12 131011001221 Santiago 3461482        94      2          2

Aca vamos a calcular promedios de personas por hogar:

rr$ing_per_h <- rr$yauthaj/rr$freq_folio

aaa <- aggregate(rr$ing_per_h, list(rr$comuna), FUN=mean)
names(aaa)[1]<-c("Comuna")
aaa$`mean.rr$ing_per_h` <- as.numeric(aaa$`mean.rr$ing_per_h`)
names(aaa)[2]<-c("calculo_propio")

write_xlsx(aaa, "aaaa.xlsx")

bbb <- read.csv2("ing_aut_percap_del_hogar_casen2011.csv")
bbb$`iaph` <- as.numeric(bbb$`iaph`)
names(bbb)[1] <- "Comuna"

ccc <- merge(x = aaa, y = bbb, by = "Comuna", all.x = TRUE)
p <- plot_ly(ccc, width = 1200, x = ~
Comuna, y = ~calculo_propio) %>%
  add_lines()
#p <- plot_ly(width = 800, height = 800)
p <- p %>% add_trace(y = ~iaph, name = 'iaph', mode = 'markers')
p
## No trace type specified:
##   Based on info supplied, a 'bar' trace seems appropriate.
##   Read more about this trace type -> https://plotly.com/r/reference/#bar
## Warning: 'bar' objects don't have these attributes: 'mode'
## Valid attributes include:
## 'type', 'visible', 'showlegend', 'legendgroup', 'opacity', 'name', 'uid', 'ids', 'customdata', 'meta', 'selectedpoints', 'hoverinfo', 'hoverlabel', 'stream', 'transforms', 'uirevision', 'x', 'x0', 'dx', 'y', 'y0', 'dy', 'xperiod', 'yperiod', 'xperiod0', 'yperiod0', 'xperiodalignment', 'yperiodalignment', 'text', 'texttemplate', 'hovertext', 'hovertemplate', 'textposition', 'insidetextanchor', 'textangle', 'textfont', 'insidetextfont', 'outsidetextfont', 'constraintext', 'cliponaxis', 'orientation', 'base', 'offset', 'width', 'marker', 'offsetgroup', 'alignmentgroup', 'selected', 'unselected', 'r', 't', '_deprecated', 'error_x', 'error_y', 'xcalendar', 'ycalendar', 'xaxis', 'yaxis', 'idssrc', 'customdatasrc', 'metasrc', 'hoverinfosrc', 'xsrc', 'ysrc', 'textsrc', 'texttemplatesrc', 'hovertextsrc', 'hovertemplatesrc', 'textpositionsrc', 'basesrc', 'offsetsrc', 'widthsrc', 'rsrc', 'tsrc', 'key', 'set', 'frame', 'transforms', '_isNestedKey', '_isSimpleKey', '_isGraticule', '_bbox'